数据要素化背景下税收风险管理面临的挑战及应对
作者:
王振宇(辽宁大学经济学院)
赵福顺(辽宁大学地方财政研究院)
数据作为经济活动中的重要生产要素,是诸如人工智能、大数据、区块链和物联网等各种数字经济新业态的基石与驱动力量,同时又具有加速劳动、资本等传统生产要素流动、共享和作用发挥的功能。我国高度重视利用数据要素推动高质量发展,自2014年首次在《政府工作报告》中写入“大数据”以来,陆续出台了系列推动数据要素赋能市场经济发展的指导性意见。鉴于此,本文结合数据要素化发展背景,深入分析数据要素创造价值的全过程,从各个环节阐述数据要素化对税收风险管理的作用机理、数据要素化背景下税收风险管理存在的问题,探索应用人工智能等先进技术应对数据要素化对税收风险管理带来的调整,以期为提升税收风险管理质效提供有益参考。
2024年1月,国家数据局会同中央网信办、科技部、工业和信息化部等多个部门联合印发了《“数据要素×”三年行动计划(2024—2026年)》(国数政策〔2023〕11号,以下简称《三年行动计划》),明确提出要以推动协同优化如何实现赋能传统产业、复用增效如何提升资源配置效率、融合创新如何塑造市场组织新形态为突破点,充分激活数据要素潜能,带动数据要素高效流通和高质量产出。本文尝试从《三年行动计划》提出的数据要素对市场经济的三方面作用出发,分析数据要素影响税收风险管理的作用机理。
(一)协同优化赋能传统产业
数据要素从形成到全面发挥作用,共包括了数据采集、数据存储、数据加工、数据流通、数据分析、数据应用、生态保障等七大环节。将数据要素全面融入土地、劳动、资本、技术等传统要素之中,有利于在多要素协同下实现生产效率提升、生产价值倍增,在提升传统产业收益的同时实现税收收入快速增长。同时,在与传统生产要素融合发展过程中,数据要素的价值创造与其他生产要素深度结合,增加了独立剥离数据要素创造价值的难度,价值分配趋于模糊化,加之数据要素具备反应速度快、体量庞大、形式多样等特点,相较于传统生产要素,不确定性更强,传统核算体系无法对其进行准确度量,使得数据要素本身创造的价值体量难以准确评估、税基规模容易被低估,可能导致在制订税收风险管理目标规划时,确定的工作重点、工作措施和实施步骤发生偏离。
(二)复用增效提升资源配置效率
数据要素具备低成本、可复制、非排他等区别于其他生产要素的特点,能够在多主体、多场景需求牵引下及循环往复利用中提高全要素配置效率。现行数字经济交易平台提供的数据服务能够有效、精准帮助市场主体实现数据要素资源共享,尤其是对同一数据要素资源重复共享使用,推动数据要素在不同经济业态中创造价值,降低企业成本。同时,由于数据要素资源共享涉及不同领域、不同产业,基于对数据要素进行分析和应用的机器人和人工智能等正在取代不少传统就业岗位,使得税务机关准确锁定数据要素创造价值的税源主体面临挑战,应用传统税收风险管理手段对数据要素化背景下的经营主体进行税收风险管理难度较大,可能制约税务机关持续提升防控和管理税收风险的能力,降低税收风险防控工作质效。
(三)融合创新塑造市场组织新形态
数据要素具有规模效应,在不同来源、不同类型、不同格式的数据要素进行碰撞与反应过程中,实现多要素之间的交融,在数据交易平台推动下,最终塑造了不同的市场组织新形态。数据要素的融合创新极大提高了生产要素间的契合度,使得经营主体可实现小型化、轻资产、低成本、高效率,极大降低了“企业家”准入门槛,活跃了市场。同时,由于数据要素类型多样、形式多元、虚拟性强、分散度高的特点,使得经营业态和经营主体种类更加丰富,纳税人取得收入方式与渠道更加多元,税务机关需要对不断出现且与传统经营主体完全不同的新兴经营主体进行及时监管,在税收风险识别指标体系构建落后于市场经济发展速度的情况下,税收风险评估和识别可能面临全面性和准确性问题。
二、数据要素化背景下现行税收风险管理存在的问题
(一)现有税收数据资源无法满足税收风险管理需求
1.税收数据收集质量不高。数据要素化背景下,经济业态各异、数据形式多样,加之纳税申报时预填报是从各个数据平台调取相关比对数据,可能存在取数口径不一致的问题,进而影响获取税收数据的精准性。
2.税收数据共享渠道尚未完全畅通。税收风险管理过程中的跨部门信息共享存在不同程度的制度性壁垒。不同政府部门对数据收集标准和要求存在差异,所以获取的涉税数据会存在标准不一的情况,使得数据交流产生障碍,可能导致部分数据无实际意义。同时,由于外部数据获取渠道单一和外部门调阅数据手续烦琐,使得税务机关从外部门直接实时交换共享的数据量受到一定的限制。
(二)税收风险管理模式和分析体系受到冲击
1.现有税收风险管理模式尚不能满足数据要素化时代要求。数据要素化催生了大量经济业态和商业模式,导致纳税主体数量、种类陡增,经济业态呈现多元化特点。数字经济的流动性、虚拟化特征使得以互联网为主要销售载体的厂商或销售者可以克服地域等交易障碍,实现数字产品和服务的瞬时远程交易,造成经济模式逐步趋于无址化和跨区域化,税源结构呈现复杂化、隐蔽化特点。加之数据要素具备应用于多场景、复用于多主体的特点,让基于数据要素应用的新服务、新产品和新结构得到了培育,实现数据要素规模扩张和类型多样,税收数据资源呈现海量化特征。现行税收风险防控多采用“条线分明”的风险管理模式,税务系统各业务部门在开展风险分析时,往往只是常规性考虑自身业务范围内的涉税风险,风险指标设置较为单一,缺乏包含多税种的税收风险联动识别和防控措施,难以对数据要素化时代多元化、复杂化的税收风险进行有效防控。
2.现有税收风险分析体系尚不能完全支撑税收风险应对。数据要素化背景下,不断更新迭代中的数字技术正在不同领域得到广泛应用,使得基于数据要素应用的新服务、新产品和新结构不断涌现,税源结构和税收风险呈现复杂化、隐蔽化特点。然而,目前数字技术在税收风险管理领域的应用仍稍显滞后,主要体现在以下两个方面。一是税收大数据平台建设仍缺乏技术支持。目前,基层税务机关对税收风险判别、等级排序工作仍缺乏高度整合税收数据、全面集成智能算法的税收风险分析系统提供技术支撑,使得在税收风险应对中可能出现应对方法针对性不强、错误应对的情况,容易造成误判高中低风险命中率的问题,进而出现对高风险纳税人采取措施滞后,影响无风险、低风险纳税人的正常经营的问题。二是税收大数据分析应用相对滞后。现行税收大数据分析应用中并未完全融入人工智能、可视化技术等大算力、大数据的工具和技术,可能存在数据分析能力不足的风险;税收风险管理指标模型构建仍存在着风险指标设置较为单一、上级与基层管理脱节等问题,没有形成上下联动、良性互动的风险防范长效机制,仍存在风险识别相对滞后的情况。比如,税务机关对虚开等发票风险识别往往具有滞后性,常常是纳税人已经虚开、申报,甚至走逃后,税务机关才被动地开展事后打击。
(三)税收数据安全隐患依然突出
1.数据安全防范机制尚不健全。在数据要素化背景下,税收风险管理数据量激增,企业财务、经营状况等商业敏感信息被泄露的风险也逐渐增加,但大部分税务机关目前没有较成熟的安全防范机制来应对税收数据采集、使用和管理过程中可能存在的安全风险。
2.税收数据泄露风险仍然存在。在数据要素化背景下,税收数据的深度挖掘、先进技术工具运用及风险指标模型构建,仅仅依靠税务人员是难以完成的,需要购买信息技术公司的技术和人工服务。但税务机关对参与税收大数据开发的社会人员的管理约束力相对薄弱,更多依靠签订保密承诺书等方式进行约束,存在税收数据泄露风险。
(一)以数据收集各环节为关口,不断提升税收大数据质量
1.实现税收数据收集标准化。严把数据来源关口,在纳税申报环节,设定数据平台间的数据匹配关系,统一比对数据口径,不断完善纳税申报预填报功能。在与第三方数据交换环节,设定数据勾稽关系,统一数据采集范本,在有效沟通前提下使用处理工具实时采集处理数据,将第三方涉税数据从原有格式最大程度地转化为税务机关数据库可用的格式,从数据采集源头开始就对数据一致性、完整性进行校验,并针对相关程序、做法,制定税收数据共享制度规范,真正实现税收数据实时、无障碍交换和共享。
2.实现税收数据收集质效化。积极推动人工智能、云计算等技术与税收风险管理深度融合,强化与政府部门、企事业单位和行业协会等的数据共享力度,不断扩大数据来源范围。定期对税收数据进行清洗,即对数据的关联性和逻辑性进行人工判定,对滞后和过期数据进行整合或剔除,不断对平台和相关工具进行维护升级,确保税收数据质量得到有效保障。
(二)以生成式人工智能为驱动,不断完善税收风险管理模式和体系
1.目标规划模块。充分结合属地实际,有计划、有重点确定税收风险管理工作措施和实施计划,进而形成系统性、全局性的规划,并运用在税收风险管理的综合体系中,起到统筹和指导作用。
2.信息收集模块。要充分将生成式人工智能技术融入信息收集功能模块中,助力完成税收数据风险识别前数据的收集、处理、净化。
(1)实施税收数据填报收集智能化。税务机关可以在对纳税人进行纳税申报时的操作流程、需要填写的信息内容、可能遇到的问题以及注意事项进行整理的基础上,运用生成式人工智能高效生成文本、图片、声音、视频等多种税收宣传素材,强化纳税申报宣传辅导,让纳税人更加便捷、深入地了解纳税信息填报相关要求。同时,在纳税人通过电子税务局进行纳税申报时,税务机关可以探索运用自然语言处理技术,第一时间识别纳税人自然语言,通过“对话”的方式,定位纳税人需求,引导按照纳税申报宣传辅导流程进行申报,直接提升纳税人申报数据的准确性和纳税人满意度。
(2)实现税收数据清洗加工程序化。完成数据收集后,要对数据进行统一清洗加工。该过程是大数据分析的一项基本内容,主要是解决数据冗余、错误、缺失、歧义等问题。外部数据经过清洗加工后形成规范的结构化数据,通过放置到大数据平台实现与税收数据的“碰面”,然后再选择更适合的机器学习算法,如决策树、向量机、深度学习等开展税收数据的分析。该过程主要是运用数据清洗加工技术,通过对海量数据分组分析,找出不良数据特点进行针对性修改,使修改后的税收数据成为能够直接用于深层加工的高质量数据。
3.风险识别模块。要将可视化分析技术、数据挖掘与统计技术、生成式人工智能深度学习及生成新数据的能力充分运用到风险识别分析建模中。同时,税收风险指标体系应包括纳税人基础信息、涉税行为、财务状况、行业特征等多方面指标,以全面、系统的方式对税收风险进行评估和识别。
(1)对税收数据进行可视化描述。运用可视化分析技术数据系统自动将清洗加工后的数据按照分析目的和预设的分析统计口径形成有规律的图表形式,将枯燥、复杂的数据升维成简明易懂的图表,对税收数据进行更清晰的描述。
(2)对税收数据进行挖掘与统计分析。采用分布式存储和混合云架构的优势,将计算工作分散给框架内各服务器,高效利用计算资源实现云计算,实现数据处理从“单点分析”向“分布计算”提速,进而提升税收数据挖掘与统计分析的效率。同时,通过同类纳税人横向比较、不同时期纳税人纵向比较,结合多种数据结构、类型、特点,应用统计学原理和分析评价方法进行更深层次的分析判断。
(3)对税收数据分析进行判断。运用生成式人工智能的深度学习以及根据训练数据生成新数据的能力,将海量涉税数据通过生成式人工智能模型进行重复自动化采集、挖掘、清洗、分析处理,通过多次比对税收数据分析结果进行判断,减少系统运行的偶然性结果。
(4)对涉税行为进行预测。运用数学建模和机器学习的方式,让计算机学习并分析海量纳税人的行为数据,预测纳税人将来可能发生的行为。同时,运用生成式模型可以学习纳税人的常规涉税行为,通过分析纳税人的历史数据,识别不寻常的交易或报税行为,提高欺诈检测的准确性。
(5)对风险等级进行识别。运用标签工厂技术及全息画像技术,帮助每个纳税人在数据平台中形成独特的助税码。税务机关可以根据现实需要,在数据平台自动扫描助税码,运用生成式人工智能模型和算法功能帮助预测和分析纳税人的基础信息、涉税行为、财务状况、信用等级等,对纳税人的税收风险等级进行识别。
4.等级排序与推送模块。通过构建指标模型对税收数据完成前述风险识别后,确定税收数据风险排序,进而对其进行风险分级评价和权重赋分,并在风控系统中实现自动预警。首先,根据风险识别结果,建立税收风险数据集成库,通过数据分类匹配,进行纳税人风险点归集;其次,通过综合评定为纳税人赋予不同风险分值,并从高到低进行等级排序;最后,确定纳税人风险等级,系统自动进行“三色云预警”。统一推送税收风险任务时,要按照税收风险等级由高到低合理确定需采取措施的应对任务数量,由风险应对部门统一推送下去,并按纳税人区域、规模和特定事项等要素,合理确定风险应对层级和承办部门。
5.风险应对模块。结合上述结果,对税收风险事项和风险点进行分类,并根据不同等级的风险采取不同的应对措施。一是税收低风险应对。对低风险事项,即“绿色预警”,采取风险提醒的方式辅导纳税人合规整改,主要通过电话、电子税务局、线上税企交流群等渠道对低风险事项的疑点指标进行充分沟通后完成应对。二是税收中风险应对。对中风险事项,即“黄色预警”,采取由纳税评估小组加基层税务机关模式开展纳税评估应对,主要通过核对法、比较分析法、逻辑推理法进行纳税评估。三是税收高风险应对。对高风险事项,即“红色预警”,先参照中风险事项要求组织人员开展纳税评估,在确认存在无法排查的重大税收风险后移交稽查部门处理。
6.过程监控及评价反馈模块。一是对税收风险管理的全周期、全流程实施有效监控。根据监控反映各环节的运行情况和最终结果,对风险识别的科学性和针对性、风险等级排序的准确性和风险应对措施的有效性进行效果评价,并将风险应对效果纳入绩效考核体系。二是加强对过程监控和评价结果的应用。根据风险管理的监控评价,进一步优化识别指标模型、完善调整目标规划,针对应对过程中发现的普遍性问题,提出征管建议,完善征管措施,堵塞征管漏洞,实现持续改进。三是实现评价反馈、建议信息的反哺。运用生成式人工智能的数据分析,全面归集分析税收风险的性质及成因,提出并向纳税人反馈风险防控建议;同时,还可基于纳税人税收大数据的分析,建立更为全面和客观的社会信用体系,增加风险识别结果的反哺推送渠道,提升以税咨政辅政效能,体现税务部门在社会治理中的影响力。
(三)以数据流转各阶段为节点,不断健全税收大数据安全管理制度机制
1.税收数据收集阶段。充分结合税收数据收集工作实际,通过融合先进技术理念和健全制度,严格控制税收数据源头安全,进而形成税收数据严而有序、用而有效的运行机制。
2.税收数据使用阶段。将权限控制措施和加密技术运用到税收风险数据加工、清洗、识别、推送等环节,确保对可能涉及企业隐私风险的情况进行合理规制,实时预警可疑活动,防止未经授权数据访问。同时,在合理合规前提下实现涉税风险数据的访问与共享,并将访问、共享人员与部门信息统计掌握,确保信息可追溯。
3.税收数据管理阶段。结合税收大数据的风险等级,从内外两个层面对税收数据进行安全管理。一是对内实施分级分类管理。针对高、中、低税收风险数据及相应纳税人建立高、中、低风险账户,使用安全加密的数据库进行存储,并定期进行轮换,确保账户安全。二是对外实时监测数据活动轨迹。通过统一数据服务接口和扩展数据服务架构,建立安全可控数据通道;同时应用可视化技术,实现风险数据活动轨迹的可视化,进而协助监测敏感风险数据活动是否异常。
4.推进技术创新。实现业务流程从“数据集中”向“云端集成”拓展,将税收风险数据处理、指标模型、比对推送等功能向云端集成,实现监管上云端、监督上云端,保障数据安全性。实现存储结构从“单服平台”向“多云混合”跨代,部署私有云存储关键业务和敏感数据,进而保证更高的安全性。
(本文为节选,原文刊发于《税务研究》2024年第10期。)
欢迎按以下格式引用:
王振宇,赵福顺.数据要素化背景下税收风险管理面临的挑战及应对[J].税务研究,2024(10):131-135.
-END-
●研发费用加计扣除政策、企业研发策略行为与数字化和绿色化创新